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14> OATA. TARGET PARAMETERS 
1S> OLOBAL REORE88ION, RESIDUES 
10> INTERNAL SCALING 
17 - SOM DATA REPRESENTATION 

IB:- LOCAL REORESSfONS ON T>1E RESIDUES FOR DIFFERENT RECEPTIVE RADCl 
1B:OPTIMAL RECEPTIVE RAOII FOR ALL NOOES 

20:- U)CAL PROGNOSIS MODELS FOR ALL NOOES FOR THE OPTIMAL RECEPTIVE RADIJ 

21 > OPTIMISED RELATIVE 6CAUNO WITH REOARD TO NOfMJNEARiTY RELATIONSHIPS 

23:- MEASURE OF NON-UNEARITV FOR THE CURRENT GLOBAL IMOOEL 

24:- MEASURE OR ORDER FOR THE CURRENT DATA REPRESENTATION 

29 - VISUALIZATION OF THE OPTlMtSEO MOOEL6 AND CHARACTERISTIC PARAMETEF» 

26 -OPTMISEO PROGNOSIS MODEL R3R ALL NOOES 

27:- NEW DATA 



(57) Abstract: The invention relates to a method for the computer-supported 
generation of prognoses for operative systems (37), in particular for control 
processes and similar, based on multi-dimensional data sets describing a sys- 
tem, product and/or process condition, using the SOM method in which an 
ordered grid of nodes (1). representing the data distribution is determined and 
an internal scaling (Gj) of variables (xj) with regard to non-linearity in the data, 
based on the non-linear influence of each variable on the prognosis variable, 
is carried out. Local receptive regions corresponding to the nodes (1) are de- 
termined, on the basis of which local linear regressions are calculated. Using 
the number of local prognosis models obtained thus, optimised prognosis val- 
ues for the control of the operative system (37) are calculated, whereby for 
each new data set the relevant sufficient nodes are determined and the local 
prognosis model applied to this data set 

(57) Zusammenfassung: Bei der rechnergestiitzten Erstellung von Progno- 
sen fur operative Systeme (37), insbesondere fiir Steuerungsprozesse u. dgL, 
auf Basis von mehrdimensionalen, einen System-, Produkt- und/oder Prozess- 
zustand beschreibenden Datensatzen unter Anwendung der SOM-Methode, 
bei der ein geoidnetes Raster von die Datenverteilung reprasentierenden Kno- 
ten (1) bestimmt wird, wird zur Beriicksichtigung von Nichtlinearitaten in den 
Daten eine interne Skalierung (Oj) von Variablen (xj) aufgrund des nichtline- 
aren Einflusses jeder Variablen auf die Prognosevariable (y) voigenommen, 
und es werden den Knoten (1) zugeordnete lokale rezeptive Bereiche ermit- 
telt, auf deren Basis lokale lineare Regressionen berechnet werden; anhand 
der so erhaltenen Menge lokaler Prognosemodelle werden optimierte Prog- 
nosewerte fur die Steuerung des operativen Systems (37) berechnet, indem 
fdr jeden neuen Datensatz der jeweils adMquate Knoten bestimmt und das lo- 
kale Prognosemodell auf diesen Datensatz angewandt wild. 
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Verfahren zur rechnergestutzten Erstelliing von Prognosen fiir 
operative Systeme sowie System zur Erstelltang von Prognosen ftir 

operative Systeme 

Die Erfindiing betrifft ein Verfahren zur rechnergestutzten Er- 
stellung von Prognosen ftir operative Systeme, insbesondere fiir 
Steuerungsprozesse u. dgl . , auf Basis von mehrdimensionalen, 
einen System-, Produkt- und/oder Prozesszustand beschreibenden 
Datensatzen unter Anwendung der SOM-Methode, bei der ein geord- 
netes Raster von die Datenverteilung reprSsentierenden Knoten 
bestimmt wird. 



Weiters bezieht sich die Erfindung auf ein System zur Erstelliing 
von Prognosen fiir operative Systeme, insbesondere fiir Steue- 
rungsprozesse, auf Basis von mehrdimensionalen, einen System-, 
Produkt- \ind/oder Prozesszustand beschreibenden DatensStzen, mit 
einer Datenbank zur Speicherung der Datensatze sowie mit einer 
SOM-Einheit zur Bestimmung eines geordneten Rasters von die Da- 
tenverteilung reprasentierenden Knoten, 

Zahlreiche Steuertechniken in operativen Systemen, z.B. bei der 
industriellen Fertigung oder auch bei der Automatisiertmg von 
Marketingmafinahmen bis hin zu f inanztechnischen Handel s systemen, 
basieren auf automatischen Einheiten zur Generierung von Pro- 
gnosen bestimmter Merkmals-, Qualitats- oder Systemparameter . 
Die Genauigkeit und ZuverlSssigkeit solcher Prognoseeinheiten 
ist zumeist eine wesentliche Voraussetzung ftir das effiziente 
Fionktionieren der gesamten Steuerung. 

Die Implementierung der Prognosemodelle hieftir erfolgt haufig 
auf Basis klassischer statistischer Methoden (sog. Multivariate 
Modelle) . Die Zusammenhange, die in den zugrunde liegenden Pro- 
gnosemodellen erfasst werden sollten, sind allerdings oft von 
nichtlinearer Natur, Fur diese Prognosemodelle sind die kon- 
ventionellen statistischen Methoden einerseits nicht direkt 
anwendbar imd andererseits, als nichtlineare statistische Erwei- 
terungen, schwer automatisierbar . 

Zur Modellierung nichtlinearer Abhangigkeiten wurde daher zum 
Teil auf methodische Ansatze aus dem Bereich der ktinstlichen In- 
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telligenz (Genetische Algorithmen, Neuronale Netze, Entschei- 
dungsbSiune etc.) zuriickgegrif f en, die eine bessere Ausschopfung 
der Information in nichtlinearen Zusanunenhangen versprechen. 
Prognosemodelle, die auf diesen Methoden beriihen, werden jedoch 
in automatisierten Systemen kaiam eingesetzt, weil ihre Effizienz 
und Stabilitat bzw. Zuverlassigkeit im Allgemeinen nicht si- 
chergestellt werden kann. Ein Grund hiefiir liegt im Fehlen sta- 
tistisch gesicherter Aussagen uber die Grenzen der Effizienz und 
Giiltigkeit von Black-Box-Modellen, d. h. in Problemen im Zu- 
saitimenhang mit Overfitting, General is ierbarkeit, Erklarungs- 
komponenten usw. 

Die vorliegende Technik beruht nun auf der Anwendung der soge- 
nannten SOM-Methode (SOM - Self-Organizing-Maps - Selbst- 
organisierende Karten) . Diese SOM-Methode, die als Basis ftir 
nichtlineare Datenreprasentationen Verwendung findet, ist an 
sich gut bekannt, vergl . T. Kohonen, "Self -Organizing Maps", 
3-Auflage, Springer Verlag Berlin, 2001, Selbstorganisierende 
Karten stellen eine nicht-parametrische Regress ionsmethode dar, 
durch welche Daten beliebiger Dimension in einen Raxom niedrige- 
rer Dimension abgebildet werden. DcJ^ei entsteht eine Abstraktion 
der xirsprtinglichen Daten. 

Das gebrauchlichste Verfahren zur Datenreprasentation bzw. 
auch zur Visual! sierung bei der SOM-Methode beruht auf einem 
zwei -dimensional en hexagonalen Raster von Knoten zur Darstellung 
der SOM. Ausgehend von einer Reihe numerischer multivariater Da- 
tensatze passen sich die Knoten des Rasters wahrend eines Adap- 
tierungsvorganges kontinuierlich der Form der Datenverteilung 
an. Auf grund der Tatsache, dass die Ordnung der Knoten unterein- 
ander die Nachbarschaf t innerhalb der Datenmenge reflektiert, 
konnen Merkmale und Eigenschaf ten der Datenverteiliong aus der 
entstehenden "Landschaf t" direkt abgelesen werden. Die 
result ierende "Karte" stellt eine lokal Topologie-erhaltende Re- 
prSsentation der urspriinglichen Datenverteilung dar. 

Zur Verdeutli Chung der SOM-Methode kann folgendes Beispiel ange- 
fflhrt werden: 



Es finden sich 1000 Personen auf einem FuiSballfeld ein, die zu- 
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failig verteilt auf der Spielfiache stehen. Es werden nun 10 
Merkmale (z.B. Geschlecht, Alter, K6rpergr66e, Einkommen usw. ) 
definiert, anhand derer sich alle 1000 Personen untereinander 
vergleichen sollen. Sie unterhalten sich und tauschen nim so- 
lange ihre Piatze, bis jeder von ihnen von Personen nmgeben ist, 
die ihm in Bezug auf die def inierten Vegleichseigenschaf ten am 
ahnlichsten sind. Es wird somit eine Situation erreicht, bei der 
jeder der Beteiligten in Bezug auf die Gesamtheit der Merkmale 
seinem unmittelbaren Nachbarn am almlichsten ist, 

Damit wird deutlich, wie es moglich ist, trotz der Mehrdimensio- 
nalitat der Daten zu einer zweidimensionalen Darstellung zu kom- 
men. Nun ist es mit dieser Verteilung der Personen auf dem 
Spielfeld mSglich, jedes der Merkmale zwei dimensional (z.B. far^ 
big codiert) darzustellen. Der Wertebereich der Farben reicht 
dabei von blau (die niedrigste AusprSgung des Merkmales) bis rot 
(die hochste Auspr^gung des Merkmales) . Visualisiert man auf 
diese Weise alle Merkmale, so erhalt man eine farbige Karte, aus 
der die Verteilung der jeweiligen Merkmale, d.h. Variablen, vi- 
suell erkennbar ist. Dabei ist zu beachten, dass eine Person 
(bzw. ein Datensatz) unabhangig von dem betrachteten Merkmal ge- 
nau auf der einen Stelle auf dem FuEballplatz zu stehen kommt. 

Zu einer fertigen SOM kann man auch noch weitere Merkmale asso- 
ziieren; dabei werden Merkmale der Datensatze, die bei der Be- 
rechnung der SOM nicht berticksichtigt werden, grafisch genauso 
dargestellt wie Merkmale, die in die SOM eingeflossen sind. Die 
Verteilung der Datensatze innerhalb der SOM Sndert sich dabei 
nicht mehr. 

Eine Anwendung von SOM ist in WO 01/8017 6 A2 beschrieben, wobei 
dort das Ziel verfolgt wird, eine Gesamtdatenmenge in Teildaten- 
mengen zu teilen, urn auf diesen dann Prognose-Modelle zu rech- 
nen. Dabei geht es aber darum, die Performance der Berechnung 
durch Verteiltxng der Rechenlast auf mehrere Computer zu 
steigem. Diesem Verfahren liegen zwar zixm Teil auch SOMs zu 
Grunde, nicht jedoch, um die Prognosequalitat zu optimieren, 
sondem (vordergrtindig) um durch das verteilte Rechnen und das 
anschliefiende Zusammenftihren der Einzelmodelle die Berechniings- 
zeit zu verktlrzen. Die dabei verwendete Prognosemethode beruht 
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insbesondere auf den sog. "Radial Basis Function (RBF) "-Netzwer- 
ken, die mit einer speziellen SOM-Variante verbxinden werden, 
welche die SOM-ReprSsentation entropie-optimiert . 

Aus der DE 197 42 902 Al ist welters eine andere Anwendting der 
SOM-Metliode bekannt, namlich bei der Planung \ind Durcbfuhriong 
von Versuchen, wobei hier jedoch speziell eine Prozessuberwa- 
chung mit dem Einsatz von SOU, ohne irgendwelche Prognosen, 
angestrebt wird. 

Es ist nun Aufgabe der Erfindung, ein Verfaiiren bzw, ein System 
der eingangs angefiihrten Art vorzusehen, mit dem eine bohe Leis- 
tungsf ahigkeit sowie eine Optimierung der Genatiigkeit der Pro- 
gnosen erzielbar ist, urn so eine hohe Effizienz der darauf 
basierenden Steuerungsanwendung im jeweiligen operativen System 
zu ermaglichen; in der Folge sollen dadurch z.B. in Fertigungs- 
prozessen qualitativ hochwertigere Produkte erhalten werden 



Das erfindiingsgemafie Verfahren der eingangs angefiihrten Art ist 
dadurch gekennzeichnet, dass zur Berucksichtigting von Nicht- 
linearitaten in den Da ten eine interne Skalierung von Variablen 
aufgrund des nichtlinearen Einflusses jeder Variablen auf die 
Prognosevariable vorgenommen wird, dass den Knoten zugeordnete 
lokale rezeptive Bereiche ermittelt werden, auf deren Basis lo- 
kale lineare Regressionen berechnet werden, und dass anhand der 
so erhaltenen Menge lokaler Prognosemodelle optimierte Prognose- 
werte fur die Steuerung des operativen Systems berechnet werden, 
indem fiir jeden neuen Datensatz der jeweils adaquate Knoten be- 
stiromt und das lokale Prognosemodell auf diesen Datensatz ange- 
wandt wird. 

In entsprechender Weise ist das erf indungsgemaiSe System der ein- 
gangs angegebenen Art dadurch gekennzeichnet, dass der SOM- 
Einheit eine Nichtlinearitats-Rtic3ckopplvingseinheit zur intemen 
Skalierung von Variablen zum Ausgleich ihres nichtlinearen 
Einflusses auf die Prognosevariable sowie eine Berechnungs- 
einheit fttr die Ermittliang von lokalen linearen Regressionen auf 
der Basis von den Knoten zugeordneten, lokalen rezeptiven Berei- 
chen zugeordnet sind, wobei in einer Predikt ions einheit auf der 



konnen. 
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Basis der so erhaltenen lokalen Prognosemodelle optimierte Pro- 
gfnosewerte berechnet werden, indem far jeden neuen Datensatz der 
jeweils adequate Knoten bestimmt und das lokale Prognosemodell 
auf diesen Datensatz angewandt wird. 

GemaiS der Erfindiing wird somit zunachst der Datenraiim in 
"Mikrocluster" zerlegt, vind danach wird ein jeweils moglichst 
homogenes/ optimales Gebiet ma diese Cluster fur die Regression 
bestimmt. In alien diesen Gebieten werden anschlieSend unter- 
schiedliche lokale Regressionen berechnet, die dann einzeln fur 
jeden Datensatz, ftir den es eine Prognose zu errechnen gilt, 
angewandt werden, je nachdem, in welchem Mikrocluster er zu 
liegen kommt bzw. welchem er angehSrt. 

Die besondere Leistimgsf ahigkeit der vorliegenden Prognose- 
technik wird . demgemas durch die Anpassung klassischer statis- 
tischer Methoden, wie Regress ionsanalyse, Hauptkomponent en- 
analyse, Clusteranalyse, auf die speziellen Gegebenheiten der 
SOM-Technologie erreicht. Mit der lokalen linearen Regression 
wird die statistische Regressionsanalyse jeweils nur auf einen 
Teil der Daten angewandt, wobei dieser Teil durch die SOM be- 
stimmt wird, d,h, durch die "Nachbarschaf t " in der SOM-Karte. 
Innerhalb dieser Teilmenge kann ein Regressionsmodell erstellt 
werden, das wesentlich spezifischer ist als ein einziges Modell 
uber alle Daten. Insgesamt werden fur ein Prognosemodell viele 
lokale Regressionsmodelle mit tiberlappenden Datenteilmengen 
erzeugt. Bei der Bestimmung eines Prognosewertes wird iramer nur 
das "nachstgelegene" Modell verwendet. 

Die vorliegende Technik kombiniert somit die FShigkeit der Self- 
Organizing Maps (SOM) zur nicht linearen Daten-ReprSsentation mit 
dem Kalkai der multivariaten Statistik, um die Effizienz der 
Prognosemodelle zu steigern und den Einsatz dif f erenzierter , 
verteilter Prognosemodelle in automatisierten Steuerungssystemen 
zu optimieren, Dabei werden die Schwierigkeiten der bekannten 
L6sungsvorschiage tiberwunden, indem von einem rein methodischen 
Ansatz Abstand genommen wird. Die Funktion integrierter Pro- 
gnosemodelle - insbesondere ihre automatisierte Anwendung in 
Steuerungsprozessen - wird in einzelne Wirkungsbereiche zerlegt, 
die -unabhangig geiast und schlieSlich neuartig in ein funktiona- 
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les Ganzes geftlgt werden. 

Bei der Erf indung wird auch - anders als beim Stand der 
Technik - dem Umstand Rechnung getragen, dass einzelne Variable 
einen iinterschiedlichen, nichtlinearen Einfluss auf die Pro- 
gnosevariable haben konnen; um diesen Nichtlinearitaten in den 
Daten Rectmiing zu tragen und eine zumindest weitgehende Kompen- 
sation hiefur vorzusehen, wird auf Basis einer globalen Re- 
gression in Verbindung mit lokalen Vorhersagemodellen eine 
Nichtlinearitatsanalyse durchgefuhrt , wobei NichtlinearitatsmaSe 
hergeleitet werden, aus denen Skalierungsf aktoren fiir eine in- 
terne Skalierung zwecks Berticksichtigung der gegebenen nicht- 
linearen Zusammenhange ermittelt werden. Nach Durchfiihrung 
dieser intemen Skalierung wird die optimierte SOM-Reprasentati- 
on erzeugt. 

In diesem Zusainmenhang ist es von besondereiti Vorteil, wenn fur 
jede Variable eine MaSzahl fur ihre Ordnung in der SOM- Re- 
presentation sowie eine MaSzahl fur ihren Beitrag zur erklarten 
Varianz gebildet wird, wobei aus diesen MaiSzahlen neue interne 
Skalierungen auf der Basis exmittelt werden, dass die geschatzte 
Anderung der erklarten Varianz durcli Variation der internen 
Skalierungen maximiert wird, wodurch die Variablen in der 
resultierenden SOM-Reprasentation entsprechend ihren Beitragen 
zur erklarten Varianz geordnet und so die vorhandenen Nicht- 
linearitaten genauer aufgelOst werden. 

Bei der Ermittliing der jeweiligen rezeptiven Bereiche (bzw. re- 
zeptiven Radien, die diese Bereich definieren) ist ein gewisser 
Spielraum gegeben, der durch die notwendige Signif ikanz einer- 
seits und die erf orderliche Stabilitat andererseits begrenzt 
wird. Innerhalb dieser Grenzen kann ein optimaler rezeptiver Be- 
reich gefunden werden, fur den die Varianz der Residuen minimal 
ist. Von Vorteil ist es daher erf indungsgemafi im Besonderen, 
wenn bei der Ermittlung der den Knoten zugeordneten rezeptiven 
Bereiche deren GrGSe jeweils so grofi gewahlt wird, dass die er- 
kiarte Varianz der lokalen Regression bei gleichzeitiger Sicher- 
stelliing der Signifikanz und Stabilitat im Bereich des Knotens 
maximal ist. Dabei ist es insbesondere gttnstig, wenn bei der Er- 
mittlung der den Knoten zugeordneten rezeptiven Bereiche jeweils 
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der ftir die Signifikanz der Regression kleinstnotwendige/ ftir 
die Maximierung der Prognosegenauigkeit grdlStmSgliche rezeptive 
Bereich gewahlt wird. 

Als vorteilhaft hat es sich auch erwiesen, weim die interne 
Skalienmg iterativ durchgefuhrt wird. 

Es ist erf indungsgemafi waiters von Vorteil, wenn ziira zumindest 
teilweisen Ausgleichen etwaiger Korrelationen zwischen Variablen 
die zugefiilirten Daten vorab einer kompensierenden Skalierung un- 
terworfen warden. Auf diese Weise warden ftir die weitere Ver- 
arbeitiing gut verwendbare Startwerte erhalten. Dabei hat es sich 
als giinstige Vorgangsweise erwiesen, wenn zur kompensierenden 
Skalierung die einzelnen DatensStze reskaliert werden, wobei die 
Werte einer jeweiligen Variablen aller DatensStze standardisiert 
werden, wonach die Daten in den Hauptkomponentenraum trans- 
formiert werden und die kompensierenden Skalierungen ftir die 
einzelnen Variablen auf der Basis berechnet werden, dass sich 
das DistanzmaS im urspriinglichen Variablenraum vom DistanzmaS im 
Hauptkomponentenraum minimal unterscheidet . Welters ist es in 
der Folge auch zwecks Verf ahrensvereinf achung vorteilhaft, wenn 
die kompensierende Skalierixng mit der die Nichtlinearitaten in 
den Daten beracksichtigenden internet! Skalierung multiplikativ 
zu einer kombinierten Variablen-Skalierung verkntipf t wird, die 
einer demgemSS modif izierten SOM-Reprasentation zugrunde gelegt 
wird. 

Fur die jeweilige Prozesssteuerung ist eine spezielle Ausfuh- 
rungsform des erf indungsgemS^fien Systems von Vorteil, die dadurch 
gekennzeichnet ist, dass an die Prediktionseinheit mehrere, ein- 
zelnen Prozesszustanden zugeordnete Steuereinheiten anschlieSen, 
die Prozessergebnisse prognostizieren, die bei den aktuellen 
Prozessdaten entstehen wiirden. 

Auch ist es hier gtinstig, wenn an die Steuereinheiten jeweils 
gesondert zugeordnete Prozesseinheiten zur Herleitung von 
Steueirparametem auf Basis der prognost izierten Prozessergeb- 
nisse und der Sollwerte ftir den jeweils im operativen System 
durchzuftihrenden Prozess anschliefien. 
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Die Erfindung wird nachfolgend anhand von besonders bevorzugten 
Ausftihrungsbeispielen, auf die sie jedoch nicht beschrSnkt sein 
soil, und vmter Bezugxiahme auf die Zeichnung noch weiter eriau- 
tert. Es zeigen: 

Fig. 1 schematisch, in einer Art Blockschaltbild, ein System 
zur Erstellung von Prognosen, wobei insbesondere das Zusammen- 
arbeiten der einzelnen Komponenten dieses Predikt ions -Systems 
veranschaulicht wird; 

Fig. 2 eine schematische Darstellxing einzelner Systemmodule 
mehr im Detail; 

Fig. 3 ein Ablauf schema zur Vercuaschaulichung der Vorgangs- 
weise beim erf indungsgemSSen Verfahren; 

Fig. 4 ein Diagramm zur VercLnschaulich\ang der mittleren 
Reichweite in AbhcLngigkeit vom rezeptiven Radius, ftir verschie- 
dene Variablen; 

Fig. 5 schematisch fur eine Dimension einen rezeptiven Be- 
reich fiir eine lokale lineare Regressions- 
die Fig. 6 und 7 zwei Diagramme fiir das nichtlineare Be- 
st immthe it smaS bzw. den geschatzten Fehler in Abbangigkeit vom 
rezeptiven Radius zur Ermittlung des optimalen rezeptiven Radi- 
us; 

Fig. 8 schematisch eine Darstellung des erf indimgsgemaiSen 
Systems in einer Anwendung bei einer Prozesssteuerung, in einer 
Art Blockschaltbild; 

Fig. 9 in den Teilfiguren 9A, 9B und 9C SOM-ReprSsentationen 
ftir verschiedene Variablen in einem beispielhaf ten Stahl-Strang- 
guss-Prozess; 

Fig. 10 in den Teilfiguren lOA, lOB und IOC entsprechende 
SOM-Karten nach Durchlaufen eines zweiten Iterationsschritts; 

Fig. 11 ftir eine der Variablen die SOM-Reprasentation nach 
einem weiteren Iterationsschritt , wobei die Datenordnung 
(Fig.llA), der nichtlineare Einfluss (Fig.llB) xind die Vertei- 
lung der rezeptiven Radien (Fig.llC) gezeigt sind; und 

Fig. 12 ein Diagramm, das die Anderung der Parameter aufgr\ind 
der Iterationen veranschaulicht. 



Es ist bekannt, dass in der SOM-Darstellung Daten so dargestellt 
werden k5nnen, dass bestimmte Eigenschaf ten der Datenverteiliing 
aus der SOM-Karte unmittelbar gesehen werden konnen. Die SOM- 
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Kairte enthait dabei zwecks Visual! sierung ein nach vorgegebenen 
Vorschriften geordnetes Raster von Knoten, z.B, in hexagonaler 
Form, wobei die Knoten des Rasters die jeweiligen Mikrocluster 
der Datenverteilung reprSsentieren. Ein Beispiel hiefiir ist in 
den nachstehenden noch naher eriauterten Figuren 9, 10 und 11 
veranschaulicht . 

Beim vorliegenden Verfahren warden nun in der SOM-Darstellung 
gro£e Datenmengen so verdichtet, dass die nichtlinearen Zu- 
saitatienhange in der Reprasentation erhalten bleiben. Hierdurch. 
werden jene Datensektoren (Mikrocluster) , welclxe die ftir die 
Modellbildung relevanten Inf ormationen enthalten, einzeln \ind 
unabhangig selektierbar . Die extrem kurzen Zugrif f szeiten auf 
diese Datensektoren ermoglichen eine wesentlich dif f erenziertere 
Unterteilung der Datenbasis und dadurch eine gezielte Nutzxing 
der enthaltenen Nichtlinearitaten ftir die Modellers tellxmg. 

Die Verkniipfiing des statistisctien Kalkuls mit geeignet 
selektierten Datensektoren gestattet in der Folge die Nutzung 
der in den nichtlinearen Zusammenhangen vorhandenen Infoanna- 
tionen bei gleichzeitiger Sicherstellung statistischer Quali- 
tats- und Signif ikanzanf orderungen. Die Selektion der lokalen 
Datensektoren, also der rezeptiven Bereiche, wird hierbei auf 
die Gewinnoing mSglichst ef f izienter Prognosemodelle bin 
optimiert. 

Aus der Menge aller optimierten lokalen Regress ionsmodelle kann 
eine Aussage dartiber getroffen werden, inwieweit die zugrunde 
liegende Datenreprasentation geeignet ist, die nichtlinearen Zu- 
sainmenhange der Variablen mit der Zielgrofee zu reprasentieren 
(Nichtlinearitatsanalyse) . Hieraus lassen sich in einem itera- 
tiven Schritt die Reprasentationsparameter der SOM-Datenverdich- 
tung (d.h. interne Skalierungen) , im Sinne einer verbesserten 
Auf lasungskraf t ftir die Nichtlinearitaten optimieren, was in der 
Polge zu noch genaueren lokalen Prognosemodellen ftihrt. 

Die besondere Art der SOM-Datenreprasentation erlaixbt sodann die 
Visual is ierung aller lokalen Model Iparameter in einem Bild. 
Durch die simultane Gegentlberstellung qualitatsrelevanter Pa- 
rameter wird die Sicherstellung der Validitat und Effizienz des 
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gesamten Prognosemodells erleichtert, beschleunigt xind ver- 
bessert . 

Das Prognosemodell als Ganzes umfasst die Menge aller lokalen 
Prognosemodelle, die als logisch oder physisch verteilt zu be- 
trachten sind. Im Einsatzmodus des Prognosemodells wird jeder 
neue Datensatz zimachst jenem Mikrocluster zugeordnet, der ihm 
am nachsten liegt. Hierauf wird das lokale Prognosemodell dieses 
Mikroclusters auf den Datensatz angewandt und das erhaltene Pro- 
gnoseergebnis der - vorzugsweise lokalen - Steuer- oder Ver- 
arbeitungseinheit zugef tihrt • 

Die spezifische SOM-DatenreprSsentation bzw. Datenverdichtung 
nimmt eine zentrale Stellung im vorliegenden Verfahren ein. Die 
gema& der Darstellung in Fig. 1 in einer Datenbank 1 gespei- 
cherten historischen Prozessdaten dienen zur in einer SOM- 
Einheit 2 innerhalb einer Prediktionseinheit 3 durchgefuhrten 
SOM-Generierimg in einem ersten Iterationsschritt des Verfah- 
rens. Basierend auf dieser SOM werden als Ergebnis einer in 
einer Einheit 4 durchgefuhrten Nichtlinearitatsanalyse neu er- 
rechnete Skalierungen zur SOM-Einheit 2, d.h. auf die Datenre- 
prSsentation, in einem zweiten Iterationsschritt riickgekoppelt • 
Diese Skalierungen optimieren die SOM-DatenreprSsentation im 
Hinblick auf die optimale Beracksichtigung nichtlinearer Zu- 
sammenhSnge in den Daten fttr die Prediktion uber den lokalen Da- 
tens ektor en, wie nachstehend noch naher eriautert werden wird. 

Die Erstellung von lokalen linearen Regressionsmodellen erfolgt 
in einer Berechnungs einheit 5 \inter der Beriicksichtigung eines 
rezeptiven Radius, der fur das jeweilige Regressionsmodell 
optimal hinsichtlich der Prognos equal i tat gewahlt wird. Mit Hil- 
fe des rezeptiven Radius wird festgelegt, wie viele Datensatze 
aus der Umgebung eines Mikroclusters ftir die Regression 
verwendet werden, Je grOfier der Radius ist, des to mehr Daten- 
satze aus den umliegenden Knoten weren verwendet: Wenn der Radi- 
us gegen "unendlich" geht, werden alle Datensatze verwendet- Die 
weiter entfernten Knoten haben aufgrund von dabei vorzugsweise 
verwendeten GauS'schen Gewichtungsfunktionen einen geringeren 
Einf luss . 
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Die Gesamtheit aller lokalen linearen Regress ionsmodelle tiber 
den Datensektoren in Koiabination mit der SOM stellt das 
optimierte Prognose -Modell dar. Dieses Gesamtmodell kann mittels 
einer Visualisierungseinheit 6 optisch dargestellt werden, und 
es kann, wie nachstehend anhand der Fig. 8'noch naher erlautert 
wird, ggf . auf einzelne Sub-Steuereinheiten verteilt und dazu 
benutzt werden, aus aktuellen Prozessdaten fur die jeweiligen 
Steuereinheiten spezifisclae Prognosen hinsichtlich der Prozess- 
ergebnisse zu erstellen, die dann zur Steuerung dieser Prozess- 
einheiten verwendet werden. 

In Fig. 1 ist hier der Einfachheit halber nur eine allgemeine 
Steuereinheit 7 veranschaulicht , die mit einer allgemeinen Pro- 
zesseinheit 8 in Verbindimg steht. Mit einem Pfeil 9 ist die in 
Echtzeit erfolgende Prozessdaten-tibermittlung - zwecks Anwendimg 
auf laufende Prozessdaten - veranschaulicht , und Pfeil 10 zeigt 
den Strom von Steuerdaten an; mit Pfeilen 11, 12 ist schlieiSlich 
die Zufuhrung von laufenden Prozessdaten zu den jeweils vor- 
hergehenden Einheiten veranschaulicht . 

In Fig. 2 ist zur Verdeutlichung das Zusammenwirken der einzel- 
nen Systemkomponeriten im Detail veranschaulicht. Dabei ist zu 
ersehen, dass die SOM-Einheit 2, die zur Datenreprasentation und 
-verdichtung vorgesehen ist, uber einen Kern 13 der Prediktions- 
einheit 3 mit den anderen Einheiten, wie insbesondere der Nicht- 
linearitat-Riickkopplungseinheit 4, in Verbindung steht, von wo 
die Resultate der lokalen Modellierung auf die Datenreprasenta- 
tion ruckgekoppelt werden, urn sodann in der Berechnungseinheit 5 
die optimierten linearen Regressionsmodelle uber lokalen Da- 
tensektoren zu erstellen. Die Visualisierungseinheit 6 zeigt 
dann die so erstellte SOM-Karte an und ermoglicht auch eine vi- 
suelle Kontrolle. 

In Fig. 3 ist der Ablauf der erf indungsgemSSen Technik schema- 
tisch veranschaulicht, wobei bei Block 14 die Datenarchivienang 
tind ZielgrOSen-Vorgabe veranschaulicht sind. In einem ersten 
Schritt (s. Block 15 in Fig. 3) erfolgt in an sich herkSramlicher 
Weise auf Basis dieser Daten eine Berechnung einer globalen Re- 
gression bzw. von Residuen, wonach gemafi Block 16 interne 
Skalierungen far die Gewinnung der SOM-Reprasentation festgelegt 
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werden . 



Im Einzelnen geht jede Daten-basierte Prognose von einer Vertei- 
liang von Rohdaten aus, die aus K Piinkten (iriit k=l.,.K) be 

steht/ wobei jeder Piinkt j Komponenten (mit j=l.,.L) besitzt, 
Abgestellt wird die Prognose auf eine Zielgrdfie yk# die im Allge- 
meinen nichtlinear von den Punkten x^^j abhSngt und in statis- 

tischem Sinn eine Zuf allsvariable ist. Die Variablen (der In- 
dex k wird der Einfachheit halber im Weiteren weggelassen) mit 
der Varianz 



werden bei der vorliegenden Technik zunSchst standardisiert iind 
dann (gemaS Schritt 16 in Fig,3) mit neuen Faktoren gemas 
folgender Beziehimg skaliert, wobei diese Faktoren interne 
Skalieriingen genannt werden: Die im Folgenden verwendeten Va- 
riablen sind somit 




. Die Kovarianzmatrix C der skalierten Variablen x^ kann immer 
durch eine orthogonale Matrix Aiq (mit i=l • . .L und q=l . . .Q) 
diagonalisiert werden: 



C = A-C^*» -A"^ 

und fur die Eigenwerte Eq 

Eq=(C^^^)qq 

gilt. 

Die Kovarianzmatrix C kann welters zerlegt werden als 





Mittels der Trans forma tionsmatrix Aiq werden die Komponenten Xj 
des Datenvektors 3c in den Hauptkomponentenraum trans formiert: 
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^'q-^Aj^*Xj^^^ q=l.,,Q,., Anzahl der Hauptkomponerxten, 

GemaS Block 17 in Fig. 3 erfolgt nun eine Berechnimg zur SOM-Da- 
tenreprS-sentation • 

Die Generierung einer SOM erfolgt in an sich bekannter Weise 
nach dem Kohonen-Algorithmus (Teuvo Kohonen, Self-Organizing 
Maps, Springer Verlag 2001) . Die nichtlineare Reprasentation der 
Datenverteilimg Xj^ s x^^j durch eine SOM hangt dabei wesentlich 
von den internen' Skalierungen der Variablen Xj ab. Eine Multi- 
plikation der internen Skalieriingen Gj mit frei bestiiranbaren Fak- 
toren iCj andert somit die Datenreprasentation, die sich aus den 
neuen Skalierungen ergibt, Tind zwar gemSlS a\ =CTj-7i^f. 

Die SOM-Datenreprasentation kann dazu benutzt werden, Teilberei- 
che von Daten zu definieren. Besteht eine SOM aus N Knoten mit 
reprasentierenden Vektoren , wobei 1=1... N, so kann eine Teil- 
menge von Daten dadurch ausgewahlt werden, dass sie innerhalb 
eines rezeptiven Radius r um einen bestiiranten Knoten 1 liegt: 

wobei 

m^, = reprSsentierender Vektor des Knoten 1' und 

Ur = {1*}... Umgebung des Knoten 1, wobei gilt: ||1— l'||<r . 

Die einzelnen Variablen werden in einer gegebenen SOM-Datenre- 
prasentation unterschiedlich gut aufgelSst. Die Ordnung der SOM 
in Bezug auf die Variablen Xj wird im vorliegenden Verfahren ftir 
einen vorgegebenen, rezeptiven Radius r durch die mittlere 
Reichweite beschrieben; 

Xj{r)^i^,mxt s).^cx){K-\) und 

?Cr):=|;c7f>.(^,-l).f-. 
wobei 

Hi die Anzahl der DatensStze im Knoten 1, 
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0-5^^^ -die Varianz der Variablen Xj in der lokalen Datenmenge 
{2^} und 

^ ein Gewiclitvingsfaktor fur den Knoten 1 ist. 

In Fig, 4 ist beispielhaft in einem Diagramm das Quadrat der 
mittleren Reichweite (x) in Abhangigkeit vom rezeptiven Radius 
r fiir verschiedene Variable V,K und T veranschaulicht , wobei 
hier das nachstehend noch nSher erlSuterte Beispiel eines Stahl- 
Stranggusses zugrundeliegt, bei dem die AbliSngigkeit der Ziel- 
grofie "Zugf estigkeit" von den Parametem Strang-Abzugsgeschwin- 
digkeit V, Abzugs temper atur T und Konzentration K von Chrom in 
der Legierungszusammensetzung angenommen ist und auf Basis von 

T- und K-Daten Vorhersagen betreffend die StahlqualitSt 
(konkret die Zugf estigkeit) zu treffen sind. 

Ftir den - tiber alle Knoten gemittelten - Reichweite -Wert gilt 
bei festem rezeptivem Radius ri ersichtlich: 

0 ... Vollstandige Ordnung der SOM innerhalb des rezeptiven 
Radius ri hinsicbtlich der - Variable x^i 

-> 1 ... Vollstandiger Xnf ormationsverlust fur lokale Regres- 
sionen nach der Variablen Xj innerhalb des rezeptiven 
Radius Tx bezuglich globaler Nichtlinearitaten in Xj. 

Urn ohne weitere Voraussetzungen eine moglichst ausgewogene SOM 
als Startpunkt ftir die nachf olgenden Schritte zu gewinnen, 
kOnnen die intemen Skalierungen vorzugsweise durch eine Methode 
festgelegt werden, die geeignet ist, etwaige Korrelationen in 
der Datenverteiliing zu kompensieren. 

Diese kompensierenden Faktoren 71^°"^ ftir jede Variable j werden so 
berechnet, dass das Distanzmafi im gegebenen Datenraum dem 
DistanzmaS im standardisierten Hauptkomponentenraum 
(Mahalanobis-Distanz) mSglichst nahe kommt. Dies ist erfullt, 
wenn: 
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Alternativ oder zusatzlich zu diesen Faktoren konnen Startwerte 
ftir die Skalieriingen auch aus vorhergehenden univariaten Nicht- 
linearitatsanalysen der Residuen verwendet werden. 

Eine Regression aller K Datenpiankte auf die Zielgrofie y wird 
hier als globale Regression (vgl, Sctiritt 15 in Fig. 3) bezeich- 
net. Die geschatzten Regressionskoef f izienten po/ pj fur den 
Schatzer y der Zielgrdfie y, mit 

I 

werden auf konventionelle Weise (vgl.. z.B. die sog* schrittweise 
Regress ion-Methode oder die vollstandige Regress ions -Me thode) 
auf Basis der -Kovarianzmatrix C berechnet, 

Die Residuen der globalen Regression ergeben sich zu 

Auf Basis einer SOM-Reprasentation kann nun ftir jede Teilmenge 
an Datenpunkten {x^ (r^)}, die innerhalb eines rezeptiven Radius ri 
iim den Knoten 1 liegt, eine lokale Regression auf das 
Residuum u, berechnet werden, vgl. Schritt 18 in Fig. 3, Falls 
zwischen der ZielgrSSe y und den Variablen xj ein nichtlinearer 
Zusammenhcing besteht, die SOM-Reprasentation unabhangig von der 
ZielgroSe y erstellt wurde, und die lokale Regression in Bezug 
auf die Variablen Xj signifikant ist, so kann durch sie ein Teil 
der (global unerklart gebliebenen) Streuung im Residuum u er- 
klart werden. 

Ein vereinfachtes Beispiel ftir eine solche lokale lineare Re- 
gression ist in Fig, 5 gezeigt, wo eine Vielzahl von Datenpunkten 
sowie eine - nicht naher bezeichnete - gesamte Regress ions kuirve 
gezeigt sind, und wobei ersichtlich ist, dass der rezeptive 
Radius r, der den rezeptiven Bereich ftir die Regression de- 
finiert, zwischen einem Minimum rmin und einem Maximinn r^ax festge- 
legt werden kann; diese Grenzen rmin/ r^ax sind durch die 
Signifikanz bzw. Linearitat des lokalen Modells gegeben. Die lo- 
kale Regress ionsgerade ist mit 18' bezeichnet. 
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Das erhaltene lokale Regress ions -Model 1 ist giiltig fur alle Da- 
tensatze, die im rezeptiven Bereich des jeweiligen Kaoten 1 
liegen; die beste Prognose-Genauigkeit ftir neue Datensatze be-- 
steht im Allgemeinen im Zentrum des Bereichs, das sind jene H 
Datensatze, die dem reprasentierenden Vektor fn^L euklidisch am 
nSchsten liegen (d,h. jene, die zu dem Knoten 1 "gehoren"). Hie- 
far gilt: 

Die lokalen Regressions-Modelle konnen wiederxjm auf Basis der 
lokalen Kovarianzmatrizen C^^> 



1 



auf die lokalen Residuen bereclmet werden: 

Die rezeptiven Bereiche kOnnen vorzugsweise auch Gauss-gewichtet 
gebildet werden, woraus gewichtete Mittelwerte, Varianzen und 
Freiheitsgrade resultieren. Der Einfachheit halber wird auf 
diese Detaillierung im Weiteren verzichtet. 

Fiir jede Menge gegebener rezeptiver Radien ri zu den Knoten 1, 
J^it 1=1.., N, konnen nun xiber der SOM- Representation die lokalen 
Regressionen (gemaS Schritt 18 in Fig. 3) ermittelt werden. Dabei 
las sen sich die folgenden an si eh bekannten Quadratsummen 
bilden: 

•s^o^' -^i^"^, ^^^toto^ gesamte Quadratsiamme des global en 

ResiduToms im rezeptiven Bereich; 

5"^'^ :=-^2]tt^^ Mittelwert des globalen Residuxjtms inner- 

' ^ halb r(l), auch Offset genannt; 

^totai ^ JLjiMki ) ... Quadratsurame des globalen Residuums re- 

kg 

lativ zum lokalen Mittelwert; 



»2<'> 2<'> . ^2«'> 



gesamte erklarte Quadratsvunme im lokalen 
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Residuum; 



^« •^Zj'^"*/"" ^ ... durch die lokale Regression erklarte 

*/ 

Quadrat sioinine ; 

* • ' " ... durch den Offset erklarte Quadratsuinme; 

und 



'"^(^k, ^^k,y unerkl^rte Quadratsuinme, Residuum 

' 2 . Or dnung • 



Fiir die erwartungstreuen Schatzer der erklarten Quadratsummen 
gilt (vgl. Kmenta, J. "Elements of Econometrics", 2. Auflage, 
1997, University of Michigan Press, Ann Arbor) : 



Ji ist die Anzahl der Regressoren fur die jeweilige lokale Re- 
gression mit dem rezeptiven Radius ri irai den Knoten 1. Damit die 
Regression einen Anteil der gesamten Quadratsumme des Residuxams 
signifikant erkiart, muss ein Overall-Test fur die an sich be- 
kannte TestgrOSe F* wie folgt erf till t sein: 

= ^ — ^ ^i-a^^uic-J'i f iii: j edes K^K^. J^J^. 

Eine vollstandige Menge von lokalen Regressionen uber der SOM- 
Reprasentation auf das Residuum u wird im Folgenden als Gesamt- 
modell (der lokalen Regressionen) bezeichnet. 



Als entscheidende GrdSe ftir die ErklSrungskraf t des Gesamt- 
modells kann das nichtlineare korrigierte Bestimmtheitsmafi R^ 
angesehen werden, das sich aus den BeitrSgen der gewichteten, 
gesch^tzten erklarten Varianzen der einzelnen lokalen Re- 
gressionen wie folgt zusammensetzt : 




Die Auf siimmierung der lokalen Beitrage zu einem Gesamtwert er- 
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folgt vorzugsweise gewichtet mit der Zahl der DatensStze Hi, die 
dem jeweiligen Knotexi 1 zugeordnet sind, z.B, 



Wesentliche Faktoren, von denen die Erklarungskraf t des Gesamt- 
model 1 s abhangt , s ind : 

a) die Bestimmung optimaler rezeptiver Radien ri fiir die lokalen 
Regressionen ; 

b) die Ermittlung einer SOM-Datenreprasentation, welche die 
nichtlinearen Zusammenliange giat auflost; und 

c) die Verbindiing von a) imd t>) so, dass die Erklarungskraf t des 
Gesacatmodells maximal wird. 

Die Prognosegenauigkeit des Gesamtmodells hangt (fur eine feste, 
vorgegebene SOM-Datenprasentation) wesentlicb von der Wahl der 
rezeptiven Radien ri ab. GemaS Schritt 19 in Fig. 3 werden daher 
nunmehr optimale rezeptive Radien ri fiir alle Knoten 1 ermittelt, 
wodurch dann gemafi Schritt 20 die gewiinschten lokalen Pro- 
gnosemodelle ftir alle Knoten, fiir die optimal en rezeptiven Radi- 
en ri, erhalten werden. 

Die optimalen Werte ropt ftir die rezeptiven Radien ri kSnnen 
vorzugsweise dadurch bestimmt werden, dass unter gleichzeitiger 
Variation aller rezeptiven Radien ri=r der Wert von r^ maximiert 
wird, vgl. auch die Darstellung in Fig, 6, wo das Mciximum in 
einer typischen Kurve von r^ (r) beim Radius ropt gezeigt ist. 

Alternativ dazu kann ri auch fur jeden Knoten 1 individuell be- 
stimmt werden, indem der geschatzte Fehler ar%^st Bereich einer 
Testmenge \m den Knoten 1 minimiert wird, Diese Alternative ist 
wieder beispielhaft im schematischen Diagramm von Fig, 7 gezeigt, 
wo bei einem typischen Kurvenverlauf f lir o-Ri^^gt®^^ Miniminn beim 
Radius r^^*^ veranschaulicht ist. 

Ftir diese Alternative fiir die Ermittlung des jeweiligen rezep- 
tiven Radius r^*^ muss zuvor eine Testmenge vom Radius r^®®*^ vim den 
jeweiligen Knoten 1 bestimmt werden, die grofi genug ist, vm den 
Fehler im Bereich des Knotens 1 signifikant zu schatzen, Dazu 
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wird vorzugsweise gefordert, dass auf Basis dieser Menge selbst 
ein lokales, signif ikantes Regress ionsmodell auf das Residuum u 
gebildet werden kann und der relative Fehler in der Schatzung 
der erkiarten Varianz <y ftir diese Menge ein vorgegebenes Ausmafi 
nicht iiberschreitet (sog. Overf itting-Test) . 

Ein erwartungstreuer Schatzer fur den Fehler der Regression im 
Bereich einer (zentralen) Testmenge ist: 



^2 



Die so in r^*" gebildeten, lokalen Prognosemodelle ftihren zu einer 
besonders guten Erklarungskraf t des Gesamtmodells . 

Die Erklarungskraf t des Gesamtmodells hSngt welters wesentlich 
davon ab, wie gut in der Datenreprasentation durch die SOM der 
nichtlineare Einfluss aller einzelnen Variablen Xj auf die Ziel- 
grc31Se y (bzw. auf das Residuum u) fur die lokalen Regressionen 
unterscheidbar wird, Es ist nun somit eine gtinstige SOM-Datenre- 
presentation zu bestimmen. 

Durch die gezielte Variation der intemen Skalierungen <yj (vgl. 
auch Schritt 21 in Fig. 3, mit der. Iterations-Rtickkopplungs- 
schleife 22) kann die Datenreprasentation so beeinflusst werden, 
dass jene Variablen, die groEe Beitrage zu R^ leisten, durch die 
SOM starker "geordnet" werden, und ihr nichtlinearer Einfluss 
auf R^ besser berechenbar xind somit optimierbar wird. 

Hierzu sollte - zumindest naherungsweise - bekannt sein, 

a) wie die nichtlinear erklarte Varianz, also das nichtlineare 
korrigierte BestimmungsmaE R^ , durch einzelne Variable be- 
st immt ist, vgl. auch Schritt 23 in Fig.3; 

b) wie sich die Ordnung der Variablen Xj in der SOM auf die durch 
die Variablen erkiarbare Varianz auswirkt; vgl. Schritt 23 in 
Fig . 3 ; und 

c) wie die Ordnxing der Variablen Xj von den internen Skalierungen 
Oi abhangt (vgl. Schritt 24 in Fig.3). 



Die Zuordnung der erkiarten Varianz §^ (genauer: der erkiarten 
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Quadrat summe) einer linearen Regression zu einzelnen Variablen 
erfolgt vorzugsweise durch folgende Zerlegxing. Es wird angenom- 
itien, dass die erklarte Quadratsumme der Grundgesamtheit 

ist . 

Durch die Zerlegung der Kovarianzmatrix C=B^ (vgl , oben) , kann 
die erklarte QuadratSTomme s'^ in eine symmetrische QuadratsxHiune 
nach Komponenten aufgeteilt werden: 

M M\ i ) 

Die Siunitianden s 'g^j koimen als korrelations-bereinigte Beitrage 
der Variablen Xj zur erkiarten Varianz s '\ betrachtet werden. Ein 
erwarttingstreuer Schatzer fiir die Summanden s ist. 

^^iiPi^ -^y -^^TjUi Definition dj:= (B -Q* • B)ij.. 

Wurde die Regression ixber eine Teilmenge der Indizes j=l...J der 
Variablen x^, j=l...L gebildet, so ist j^^ae Matrix, die' durch 
Inversion jenes Teilbereichs der Kovarianzmatrix C hervorgeht, 
der den in die Regression auf genommenen Variablen Xj, j=l, .J ent- 
spricht, erganzt um Null-EintrSge in jenen Sektoren, die den 
nicht auf genommenen Variablen entsprechen. 

Auch fur die nicht in die Regression auf genommenen Variablen 
gilt dann aufgrund der Korrelation mit den auf genommenen Varia- 
blen, dass im Allgemeinen S^j^^o, 

Fiir eine gegebene Menge lokaler Regressionen wird nun der Bei- 
trag einer Variable Xj zur erkiarten Varianz des Gesamtmodells 
durch eine gewichtete Stamme bestimmt: 



Definiert man ftir den positiven Anteil an der erklSrten Varianz 
im Gesaiatmodell : 
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SO ergibt sich als Kennzahl far den relativen Einfluss 
("Influence") der Variablen Xj auf die erkiarte Varianz des Ge- 
samtmodells : 

/ — ^p*J 

Das nichtlineare Bestimmtheitsmafi kann mit dem relativen 
Einfluss Ij ebenfalls den einzelnen Variablen Xj zugeordnet 
werden, und zwar gemafi der Beziehxxng 

^Lj '-Ij RIl' 

Diese Zerlegung wird vorzugsweise zur Beschreibung der BeitrSge 
einzelner Variablen zum nichtlinearen Bestimmtheitsmafi eines aus 
einer Menge lokaler Regressionen gebildeten Gesamtmodells her- 
angezogen, 

Wie bereits erwahnt und jetzt nachfolgend verdeutlicht ist die 
erkiarbare Varianz von der Ordnung der SOM abhangig. 

Zum Zwecke der einfacheren Beschreibung wird im Weiteren davon 
ausgegangen, dass die Datenverteilung in den Raum der Haupt- 
komponenten transf onaiert wurde bzw. dass Equivalent dazu gilt: 

Der Verlust an Information durch die mangelnde Ordnung der Da~ 
tenreprSsentation der SOM hinsichtlich der Variablen Xj kann 
durch die mittlere Reichweite ausgedriickt werden (vgl . oben) . 
Der Zusammenhang zwischen dem Verlust an erklarbarer Varianz und 
der Reichweite kann empirisch durch eine Verlustf unktion 
^iAj) gemSS folgender Beziehung approximiert werden: 



Im vorliegenden Verfahren werden jene Variablen xj, die auf die 
erkiarte Varianz der Zielgr5fie y bzw. auf das Residuum u einen 
grofien Einfluss haben, starker gewichtet, d.h. mit einem gr6£e- 
ren Skalierungsf aktor versehen, so dass die nichtlineare Abhan- 
gigkeit der Variablen xj besser beracksichtigt und somit das 
nichtlineare Bestinantheitsmafi r^ ma^cimierbar wird. 
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Fttr die nun folgende Untersuchung der Abhangigkeit der mittleren 
Reichweite von den internen Skaliernngen der SOM wird angenom- 
men, dass die internen Skalierungen a, der trans fontiier ten Da ten- 
vert ei lung gemafi der Beziehung 

vorliegen. 

Im Hauptkomponentenraum hangen die Reichweiten A/q in einfachster 
Naherung von in einer Form ab, die heuristisch durch folgenden 
funktionalen Zusammenhang angenahert werden kann: 



'2 



>\(crp.--crg,r^)»tanh 



Dieser Zusaniinenhang A.q(aq) ist hinreichend genau, um eine itera- 
tive Maximierung (s, Schleife 22 in Fig. 3) des nichtlinearen Be- 



ss V ^ 

2u ermogliclien. 



stinmittLeitsmaSes Rj^ durch Variation der internen Skalierungen Gq 



Die oben erlauterten Schritte zur Bestimmung einer giinstigen Da- 
tenreprasentation werden nun so mit der Optimierung der lokalen 
rezeptiven Bereiche verknUpft, dass die nicht linear erklSrte Va- 
rianz im Residuum maximiert wird, d.h. die Prognosegenauigkeit 
des Gesamtmodells optimiert wird, wie nunmehr nSher eriautert 
wird. 



Zur Vereinfachung wird im Folgenden die Datenverteilung wieder 
als in HauptkompQnenten trans fo3rmiert angenommen. Unter der na- 
herungsweisen Voraussetzxmg, dass im Hauptkomponentenraum die 
VerlustfunktionenZ>(>l^) voneinander unabhangig sind, ergibt sich 
ftir den durch die Variable Xq maximal erkiarbaren Varianzanteil : 

Bei einer Anderung der internen Skalierungen o"^ -^cr^ folgt hieraus 
eine relative Anderung \|f der erkiarten Varianz im Gesamtmodell, 
d.h. von R^ , gemaiS: 
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Durch Variation von kann nun iterativ oder expliziert ma- 
ximiert werden, Vorzugsweise geschieht dies durch parametrische 
NSherung der Bedingung (s. Block 21 in Fig, 3) 

^(crj',,.,o"g)->max , auf Basis der partiellen Ableitungen 

ay 

Qrr' ' (sog. "hill climbing"), woraus ein neuer Satz von Aq und 
hieraus ein Satz von Skalierungen cr^ folgt. Diese haben die Form 
arctaiih(^,) 

* * arctanh(A;) * 

Diese neuen Skalierxingen ftihren zu einer neuen SOM-Reprasentati- 
on der Daten, welche die Nichtlinearitaten im Zusammenhang y{Xq) 
besser auflQst als auf Basis der Skalierungen in der vorherigen 
1 1 era t i ons s t uf e . 

Durch wiederholte Anwendung der Re-Skalier\ingen a'^(Schleif e 
22 in Fig. 3) erreicht man so eine sukzessive Verbesserung der 
Datenreprasentation, in welcher die Prognosegenauigkeit des Ge-- 
samtmodells durch die Optimierung der rezeptiven Reichweiten ma- 
ximiert wird. 

Die erhaltenen optimierten Prognosemodelle tmd KenngroSen werden 
bevorzugt auch visualisiert , vgl. Block 25 in Fig. 3, urn eine zu- 
satzliche Validierung des Gesamtmodells zu erlauben. 

GemaS Block 26 in Fig. 3 werden die auf diese Weise erhaltenen 
optimierten Prognosemodelle fiir alle Knoten in passender Weise 
auf neiie Daten (siehe Block 27 in Fig. 3) angewandt, um so eine 
optimierte Prognose (Block 28) zu erzielen. Hierbei wird jeweils 
das lokale Prognosemodell jenes Knotens auf den jeweils neuen 
Datensatz angewandt, dessen Reprasentant dem Datensatz am nachs- 
ten liegt (vgl . oben) . 

Nachfolgend wird der vorstehend allgemein beschriebene Ablauf in 
einer konkreten beispielhaf ten Anwendung ftir die Steuemng eines 
Stahl-Stranggusses - mit den Variablen (xi bis X3) : Temperatur T 
(Strangschale) , Strangabzugsgeschwindigkeit V und Legierxings — 
bestandteil-Konzentration K (far Chrom) - naher eriautert, wobei 
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die ZielgraSe ein bestimmtes Stahlqualitats-MaiS, namlich bei- 
spielhaft die Zugf estigkeit des Stahls, ist. Dabei wird der 
Stahlproduktionsprozess durch die laufende Prognose der Stahl- 
qualitat (die Zugf estigkeit) optimiert. Aniiand der prognosti- 
zierten Qualitat werden die Steuerparameter (in diesem Beispiel 
die Abzugsgeschwindigkeit V) laufend so verandert, dass die tat- 
sachliche Zugf estigkeit die geforderte H61ie oder Gtite erreicht. 

Zur Vereinfachxing wird angenommen, dass bei diesem Verfahren le- 
diglich die drei genannten Steuergrofien V, K und T des Prozess- 
zustands die Stahlqualitat bestimmen: 

Als historische Daten zur Modellerstellung wurden in diesem Bei- 
spiel 26.014 Datensatze im Laufe eines Prodtiktionsprozesses 
erhoben. Die einzelnen Variablen mit den Mittelwerten 



wurden in der Datenvorverarbeitung jeweils auf einen Mittelwert 
= 0 imd eine Varianz = 1 standardisiert und in dieser Form wel- 
ter verarbeitet. 

Die errechneten und optimierten lokalen Regress ionsmodelle 
kSnnen auf einzelne zugehSrige, "lokale" Steuereinheiten 
30.1...30,n aufgeteilt werden, wie im Schema von Fig, 8 gezeigt 
ist; die Berechnung der Prognosewerte kann in diesem Fall in den 
lokalen Steuereinheiten 30,1 30. n stattfinden und dient zur 

Steuerung von zugehorigen, angeschlossenen Prozesseinheiten 
31. 1-31. n. Es ist aber auch moglich, das Gesamtmodell zentral zu 
verwalten und die Prognosewerte ftir die lokalen Steuereinheiten 
30.1...30.n zentral zu berechnen und anschlieJSend entsprechend 
zu verteilen. 

In Fig. 8 ist im Obrigen welters bei 32 eine Datenbank fur die 
Prozessdaten veranschaulicht , die in einer Datenkompressions- 
und Reprasentationseinheit 33 fiir die SOM-Reprasentation aufbe- 
reitet werden. Bei 3 ist in Fig. 8 die bereits anhand der Fig.l 
eriauterte Prediktionseinheit veranschaulicht, der die vor- 



V = 0,291 m/s 
K = 2,23% Cr 
T = 540OC 
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stehend erwaiinten Steuereinheiten 30.1, 30.2 30. n nachgeord- 

net sind. An letztere schlieSen die Prozesseinheiten 31.1, 31.2 
... 31. n an, die schlieSlich zu einer Prozesssystem-Einheit 34 
ftihren. 

Die Komponenten 32, 33 kormen als Einrichtiing fxir die Daten- 
haltiing 35 bezeichnet werden, wogegen die Einheiten 3 und 30,1, 
30.2...30.n ein Steuersystem 36 und die Prozesseinheiten 31.1, 
31. 2.., 31. n sowie die Prozesssystem-Einheit 34 ein operatives 
System 37 definieren. 

Im Folgenden wird nun das vorliegende Verfahren anhand des ange- 
sprochenen Stahlguss-Beispiels mit den Variablen Konzentration 
K, Geschwindigkeit V und Teitiperatur T sowie der ZielgroSe Zug- 
festigkeit exemplarisch durchlaufen. Ziel dabei ist, die Zugfes- 
tigkeit durch optimale Einstellung von V aufgrund einer 
moglichst genauen und selektiven Prognose der Zugf estigkeit zu 
optimieren. 

In einer ersten Stufe des Verfahrens wurde zunachst eine voll- 
standige, globale Regression der Zugf estigkeit auf alle drei Va- 
riablen K, V und T gebildet. Diese weist ein korrigiertes 
Bestimmtheitsmafi von 0,414 auf, d.h. es kSnnen 41,4% der ge- 
samten Streuxang durch die globale Regression erklart werden. 
Daraufhin wurde mit Hilfe der intemen Skalierungen zur Kom- 
pensation von Korrelationen eine SOM errechnet, die in einer et- 
was vereinfachten Darstellung in Fig.9A (fxir die Variable V = 
Strangabzugsgeschwin-digkeit) ; Fig.9B (fiir die Variable K = Kon- 
zentration von Cr) ; und Fig.9C (fur die Variable T = Strangtem- 
peratur beim Abziehen) zu sehen ist. Die Vereinf achxing wurde 
insbesondere aufgrund des Verzichts der Machtigkeit einer farb- 
codierten Wertedarstellung vorgenoiranen ; statt dessen wurde eine 
ftinfstufige Schwarz/weiS-Darstellung gewcLhlt, wobei weifi den 
niedrigsten Wert darstellt, gepimktete Fiachen den nachst nied- 
rigen u.s.w., und wobei schwarz die FlSchenf til lung ftir Bereiche 
mit den hOchsten Werten ist. 



In der Darstellung von Fig. 9 ist insbesondere in Fig.9A (ftir die 
Variable V, also die Abzugsgeschwindigkeit ) zu erkennen, dass 
die Werte tiber den gesamten Bereich relativ stark gestreut sind. 
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d.h. maSig gut geordnet sind. 

In den Darstelliingen von Fig. 9 (vgl. insbesondere Fig.9A) wurde 
welters auch zur besseren Verstandlichkeit einer der Knoten 
- bei 1 - samt rezeptivem Bereich eingezeichnet , wobei in Fig.9A 
auch ein zugehoriger rezeptiver Radius r eingetragen wurde, der 
den (kreisformigen) rezeptiven Bereich definiert. 

Betrachtet man den nichtlinearen Einf luss der einzelnen Varia- 
blen fiir diese Reprasentation, so ergibt sich, dass der nicht- 
lineare Einf luss der Abzugsgeschwindigkeit V im Vergleich zu den 
anderen Variablen am grOfiten ist. Folgende nichtlineare 
Einfltisse Ij, mit j = v, K, T, errechnen sich ftir die einzelnen 
Variablen: 



Als nichtlineares Bestimmtheitsmafi R^ der ersten Iteration er- 
gibt sich R^ = 0,238, Dieser Wert bedeutet, dass von der global 
unerklart gebliebenen Varianz noch 23,8% durch nichtlineare 
(lokale) Regressionen erkiart werden kSnnen. 

Daraus lei ten sich (s. die vorstehenden Darlegungen) jene inter- 
nen Skalierungen ab, die die NichtlinearitSten und OrdnxangsmaSe 
dieses Iterationsschrittes ftir eine verbesserte SOM-Darstellung 
ergeben : 



Mit diesen neuen internen Skalierungen wird nun die SOM-Datenre- 
prasentation der nSchsten Iteration parametrisiert , wobei sich 
gegenuber Fig. 9 modifizierte SOM-Darstellungen ergeben, und zwar 
gemaS Fig ,10 A fur V, gemSLS Fig. 1 OB ftir K und gemafi Fig. IOC fur 
T. Aus diesen neuen SOM-Reprflsentationen ist zu erkennen, dass 
die Ordnxing innerhalb der Fig.lOA (fur die Abzugsgeschwindigkeit 
V) erhSht wurde, wShrend insbesondere die Ordnung in Fig. IOC 
(Temperatur) geringer geworden ist. Dies entspricht der An- 
forderung, Nichtlinearitaten durch die SOM-ReprSsentation besser 
erkennen und in den lokalen Regressionen nutzen zu kSnnen. . 



Iv= 0,687, Ik = 0,210, It 



= 0,103 , 



a'v= 1,634, a"K = 0,711, a- 



0,543. 



Mit den jeweiligen Nichtlinearitats- und Ordnungsmafien sowie dem 
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nichtlinearen Bestimmtsheitsmafi errechnen sich sodaim die in- 
temen Skalieningen ftlr die nSchste Iteration, deren Ergebnis in 
Pig.llA, IIB und IIC dargestellt ist. Dabei ist im Einzelnen 
beispielhaft fiir die Variable V (Abzugsgeschwindigkeit ) in 
Fig.llA deren SOM-Reprasentation gezeigt, in Fig,llB ist der 
standardisierte lokale Regressionskoef f izient ^^^^ fiir die Abzugs- 
geschwindigkeit auf die Zugf estigkeit (=Zielvariable) ver- 
anschaulicht, und in Fig.llC ist die zugehGrige Verteilung der 
optimalen rezeptiven Radien ftir die lokale lineare Regression 
tiber der Datengesamtheit dargestellt. 

Wie aus der Darstellxing in Fig.llA ersichtlich ist, ist die Ord- 
nung innerhalb der SOM ftir die Variable V im letzten Iterations - 
schritt weiter erliSht worden. 

In Fig. 12 ist die Anderung aller Parameter K, V und T sowie 
von R^ liber die drei Iterationsstuf en Nr. 1, 2 und 3 in einem 
Dia-gramm gezeigt. 

Im Einzelnen enthait Fig. 12 die Darstellung des Verlaufs der 
nichtlinearen Einflusse fur die einzelnen Variablen V, T so- 
wie des resultierenden Parameters r^ tiber den Iterations- 
schritten 1, 2 und 3. Durch das nichtlineare Bestimmtheits- 
mafi R^ kOimen nach dem 3 • Schritt auch von den verbliebenen 
58,6% der global xanerklSrten Varianz 34,7% nichtlinear erkiart 
werden, so das s nun insgesamt 61,7% der gesamten Streuung er- 
kiart werden konnen. 

Im Produktionsprozess erfolgt der Einsatz des Prognosemodells 
durch die Zuordnung jedes neuen Prozessdatensatzes zu jenem 
Knoten, welcher dem jeweiligen Zustands- bzw, Qualitatsbereich 
des Prozesses entspricht. Ftir jeden dieser Bereiche gibt es nun 
ein eigenes Prognosemodell, das den Zusammenhang der Einfluss- 
graSen mit dem Zielwert selektiv beschreibt. 

Die Zuordnung erfolgt entsprechend dem geringsten Abstand des 
Datensatzes z\am Knoten 1 gemafi 
, argmin,^ ^ , 

Das lokale Prognosemodell dieses Knotens wird sodann auf den Da- 
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tensatz angewandt land die prognostizierte Zugf estigkeit zur Ein- 
stelltmg der optimalen Abzugsgeschwindigkeit herangezogen . 

Diese im Vergleich zum Stand der Technik dif f erenzierte Prognose 
erlaiibt eine selektivere Vorhersage der Zugf estigkeit in Abhan- 
gigkeit von K, V und T im jeweiligen lokalen Zustandsbereich. 
Durch die Anwendung des Gesamtmodells auf die neuen Daten im 
Rahmen des Produktionsprozesses kommt es so zu einer insgesaiaten 
Qualitatsverbesserung des produzierten Stalilproduktes . 

In ahnlicher Weise lasst sich die Erf indung selbstverstandlich 
auf die vers chiedens ten Produktionsprozesse etc, anwenden, ins- 
besondere auch bei Fertigungslinien, ebenso wie auf automatische 
Verteilsysteme und andere operative Systeme. 
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1. Verfahren zur rechnergestatzten Erstellung von Prognosen far 
operative Systeme (37), z.B. far Steuerungsprozesse u. dgl . , auf 
Basis von mehrdimensionalen, einen System-, Produkt- und/oder 
Prozesszustand beschreibenden DatensStzen unter Anwendung der 
SOM-Methode, bei der ein geordnetes Raster von die Datenvertei- 
lung reprSsentierenden Knoten (1) bestimmt wird, dadiirch gekenn- 
zeichnet, dass zur BerCicksichtigung von Nichtlinearitaten in den 
Daten eine interne Skalierung (Cj) von Variablen (xj) aufgriond 
des nichtlinearen Einflusses jeder Variablen auf die Prognoseva- 
riable (y) vorgenommen wird, dass den Knoten (1) zugeordnete lo- 
kale rezeptive Bereiche ermittelt warden, auf deren Basis lokale 
lineare Regressionen berechnet warden, und dass anhand der so 
erhaltenen Menge lokaler Prognosemodelle optimierte Prognose- 
werte far die Steueriong des operativen Systems (37) berechnet ' 
werden, indem far jeden neuen Datensatz der jeweils adaquate 
Knoten bestiirant und das lokale Prognosemodell auf diesen Daten- 
satz cuigewandt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass far 
jede Variable eine MaEzahl fOr ihre Ordnung in der SOM-Re- 
prasentation sowie eine Mafizahl fOr ihren Beitrag zur erklarten 
Varianz gebildet wird, wobei aus diesen MaiSzahlen neue interne 
Skalierungen (az) auf der Basis ermittelt werden, dass die ge- 
schatzte Anderung (\|r) der erklSrten Varianz durch Variation der 
internen Skalierungen maximiert wird, wodurch die Variablen in 
der resultierenden SOM- Representation entsprechend ihren Beitra- 
gen zur erklarten Varianz geordnet und so die vorhandenen Nicht- 
linearitaten genauer aufgelSst werden. 

3.. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, 
dass bei der Ermittlung der den Knoten (1) zugeordneten rezep- 
tiven Bereiche (r) deren GrSSe jeweils so grog gewShlt wird, 
dass die erkiarte Varianz der lokalen Regression bei gleichzei- 
tiger Sicherstellung der Signifikanz urid Stabilitat im Bereich 
des Knotens maximal ist. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass bei 
der Ermittlung der den Knoten (1) zugeordneten rezeptiven Berei- 
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Che (r) jeweils der fur die Signifikanz der Regression kleinst- 
notwendige, ftir die Maximierung der Prognosegenauigkeit grOSt- 
mogliche rezeptive Bereich gewahlt wird. 

5. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekenn- 
zeichnet, dass die interne Skalierxmg iterativ durchgefiihrt 
wird. 

6. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekenn- 
zeichnet, dass zum zumindest teilweisen Ausgleichen etwaiger 
Korrelationen zwischen Variablen (j) die zugeftihrten Daten vorab 
einer kompensierenden Skalierung (7Tj°°^) unterworfen werden. 

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet , dass zur 
kompensierenden Skalierung die einzelnen Datensatze reskaliert 
werden, wobei die Werte einer jeweiligen Variablen aller Daten- 
satze standardisiert werden, wonach die Daten in den Haupt- 
komponentenraim transf ormiert werden und die kompensierenden 
Skalierungen fur die einzelnen Variablen auf der Basis berechnet 
werden, dass sich das DistanzmaE im ursprunglichen Variablenraum 
vom Distanzmafi im standardisierten Hauptkomponentenraum minimal 
unterscheidet • 



8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, 
dass die kompensierende Skalierung mit der die Nichtlinearitaten 
in den Daten berttcksichtigenden intemen Skalierung multiplika- 
tiv zu einer kombinierten Variablen-Skalierung verkniipf t wird, 
die einer demgemas modif izierten SOM-ReprSsentation zugrxmde ge- 
legt wird. 



9. System zur Erstellung von Prognosen ftir operative Systeme, 
z.B. ftir Steuerungsprozesse, auf Basis von mehrdimensionalen, 
einen System-, Produkt- und/ oder Prozesszustand beschreibenden 
Datensatzen, mit einer Datenbank (1) zur Speicherung der Daten- 
satze sowie mit einer SOM-Einheit (2) zur Bestimmung eines ge- 
ordneten Rasters von die Datenverteilung reprasentierenden 
Knoten, dadurch gekennzeichnet, dass der SOM-Einheit (2) eine 
ztir intemen Skalierung von Variablen zum Ausgleich ihres nicht- 
linearen Einflusses auf die Prognosevariable eingerichtete 
Nichtlinearitats-Rtickkopplungseinheit (4) sowie eine far die Er- 



wo 2004/029738 




'CT/AT2003/000289 



- 31 - 



mittlung von lokalen linearen Regressionen auf der Basis von den 
Knot en zugeordneten lokalen rezeptiven Bereichen eingerichtete 
Berechnungseinheit (5) zugeordnet sind, wobei weiter eine 
Prediktionseinheit (3), vorgesehen ist, die eingerichtet ist auf 
der Basis der so erhaltenen lokalen Prognosemodelle optimierte 
Prognosewerte zu berechnen, indem fur jeden neuen Datensatz der 
jeweils adSquate Knoten bestimmt und das lokale Prognosemodell 
auf dies en Datensatz angewandt wird, 

10. System nach Anspruch 9, dadurch gekennzeichnet , dass an die 
Prediktionseinheit (3) mehrere, einzelnen Prozesszustanden zuge- 
ordnete Steuereinheiten (30 . 1 . . . 30 .n) anschliefien, die ein- 
gerichtet sind, Prozessergebnisse zu prognostizieren, die bei 
den aktuellen Prozessdaten entstehen wiirden. 

11. System nach Anspruch 10, dadurch gekennzeichnet , dass an die 
Steuereinheiten (30 . 1 . . . 30 .n) jeweils gesondert zugeordnete Pro- 
zesseinheiten (31 . 1 . . . 31 .n) anschlieSen, die zur Herleitung von 
Steuerparametem auf Basis der prognostizierten Prozessergeb- 
nisse und der Sollwerte ftir den jeweils im operativen System 
durchzufuhrenden Prozess eingerichtet sind. 
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